Entwicklung eines integrierten Wissensgraphen
aus Ontologien für
Biodiversität und Landwirtschaft

Präsentation zur Masterarbeit

Thorsten Hauke

Master Data Science
Fachbereich 5 – Informatik und Sprachen
Hochschule Anhalt

5. Februar 2024

Agenda

Grundlagen

Grundlagen

Abbildung 1a: Vereinfachte Ontologie

Ontologie

  • Klassen/Begriffe: Knoten
  • Beziehungen: Kanten
  • Eigenschaften
  • meist in RDF-Formaten serialisiert

Grundlagen

Abbildung 1b: Ontologie-Matching

Ontologie-Matching

Grundlagen

Abbildung 1b: Ontologie-Matching

Ontologie-Matching

  • finden von Gleichheitsbeziehungen
  • \(k = 2\)

Grundlagen

Abbildung 1c: holistisches Ontologie-Matching

Ontologie-Matching, holistisch

  • finden von Gleichheitsbeziehungen
  • \(k > 2\)

Motivation und Ziele der Arbeit

Motivation Wissensgraph

Abbildung 1d: Wissensgraph
  • Wissensrepräsentation als Teilbereich der künstlichen Intelligenz
  • Semantik
  • Datenintegration
  • Annotation
  • Machine Learning

Ziele der Arbeit

  1. Recherche zu Ontologien der Biodiversität und Landwirtschaft
    ➔ Vergleichender Überblick
  1. Aufbau eines integrierten Wissensgraphen
  1. Anwendung und Analyse des integrierten Wissensgraphen

Überblick zu Ontologien der Biodiversität und Landwirtschaft

Überblick zu Ontologien der Biodiversität und Landwirtschaft

Überblick zu Ontologien der Biodiversität und Landwirtschaft

  • 41 Ontologien

Überblick zu Ontologien der Biodiversität und Landwirtschaft

  • Vier RDF-Serialisierungsformate

Überblick zu Ontologien der Biodiversität und Landwirtschaft

  • Neun Ontologie-Portale

Überblick zu Ontologien der Biodiversität und Landwirtschaft

  • Indikatoren: Aktualität, Wichtigkeit, Status und Verfügbarkeit.

Aufbau eines holistischen Wissensgraphen

Aufbau eines holistischen Wissensgraphen

Matching aller \(k\) Ontologien zur Bestimmung von sameAs-Kanten

Integration der \(k\) Ontologien mit den erzeugten Kanten und Import in die Graphdatenbank

Deskriptive sowie interaktive Analyse und Graphenanalyse wie Clustering

Visualisierung von Teilen des Wissensgraphen (interaktiv und statisch)

Aufbau eines holistischen Wissensgraphen

  • Matching: AgreementMakerLight (Faria u. a. 2013)

  • Graphdatenbank: Neo4j

  • Neosemantics

  • implementiert in Python 3

  • ca 9,5 Mio Tripel ➔ Wissensgraph

Aufbau eines holistischen Wissensgraphen

Abbildung 2: Ausschnitt aus 3000 Knoten

Aufbau eines holistischen Wissensgraphen

Abbildung 2: Ausschnitt aus 3000 Knoten

Eigenschaften des Wissensgraphen

  • 12 Ontologien
  • Bereinigt und vereinheitlicht
    • Bezeichner (AGROVOC, EN)
    • Hierarchische Beziehungstypen
  • >100.000 Knoten
  • Erweiterbar
  • Holistisch

Anwendung und Analyse

Anwendung und Analyse

MATCH p=()-[:rdfs__subClassOf*1..3]->()
RETURN p

Abbildung 3: Ergebnis der subClassOf-Abfrage

Anwendung und Analyse

MATCH (n:Resource)-[r:SAME_AS]-(m:Resource)
WHERE r.Aligned_by = 'AML' AND r.Measure < 0.85
RETURN n, r, m

Abbildung 4: Ergebnis der AML-Schwellwert-Abfrage

Fazit

Fazit


Beantwortung der drei Ziele im Kontext der Biodiversität und Landwirtschaft

  1. Vergleichender Überblick
  2. Aufbau eines Wissensgraphen
  3. Anwendung und Analyse

Fazit


Limitationen

  • Ressourcen: Laufzeit
  • Einfache Bereinigung
  • Expertenwissen

Zukünftige Arbeit

  • Einbinden von Werkzeugen zur Annotation
  • Bereinigung in Zusammenarbeit mit Domänenfachleuten
  • Versionen (Graphtemporale Analysen)

Quellen

Literatur

Faria, Daniel, Catia Pesquita, Emanuel Santos, Matteo Palmonari, Isabel F. Cruz, und Francisco M. Couto. 2013. „The AgreementMakerLight Ontology Matching System“. In On the Move to Meaningful Internet Systems: OTM 2013 Conferences, herausgegeben von Robert Meersman, Hervé Panetto, Tharam Dillon, Johann Eder, Zohra Bellahsene, Norbert Ritter, Pieter De Leenheer, und Deijing Dou, 527–41. Berlin, Heidelberg: Springer Berlin Heidelberg.


Bildnachweis

Titel-Seite: Video von Ella Gronewold (Pexels, CC0)

Hintergrund der Abschnitte Colored Particles, Matteo Bruni (tsParticles)

Live-Demo